Tool Use
LLM 调用外部工具(计算器 / 搜索 / API / 代码执行 / 浏览器)完成任务的能力,是 AI Agent 范式的核心组件。
定义
Tool Use 是 Function Calling 的更宽泛概念,泛指 LLM 通过调用外部工具扩展能力的范式。常见工具包括:
- 计算器 / 代码执行:数学计算、数据处理
- 搜索 / 检索:网页搜索、知识库查询(与 RAG 结合)
- API 调用:第三方服务(天气、股价、地图、订票)
- 数据库查询:SQL 生成与执行
- 文件系统:读写文件、执行命令
- 浏览器:Anthropic Computer Use 等 GUI 操控
技术细节
实现方式:
- Function Calling 模式:LLM 输出 JSON 调用,应用代码执行(主流)
- 代码生成模式:LLM 直接生成 Python 代码,沙盒执行(如 Code Interpreter)
- ReAct 模式:思考-行动-观察循环(ReAct)
主要玩家
- Anthropic — Tool Use API,含 Computer Use(GUI 操控)
- OpenAI — Function Calling + Code Interpreter
- LangChain — Tool 抽象(开源框架层面)
- CrewAI — 多 Agent 工具协作
在 AI 产业链中的角色
Tool Use 让 LLM 从"语言模型"进化为"通用任务执行器",是 AI Agent 商业化的必要前提。Tool Use 的成熟度直接决定 Agent 能解决多复杂的任务。
演进历史
- 2022 Meta Toolformer 论文奠基
- 2023 ReAct / Function Calling / Code Interpreter 商业化
- 2024 Anthropic Computer Use 把 Tool Use 扩展到 GUI 操控
- 2025 Computer Use / Browser Use / MCP(Model Context Protocol)等协议生态形成
相关概念
∈ belongs_to::4-03-模型生态与工具链